Enrichissement sémantique de documents XML représentant des tableaux
نویسندگان
چکیده
Résumé. Ce travail a pour objectif la construction automatique d’un entrepôt thématique de données, à partir de documents de format divers provenant du Web. L’exploitation de cet entrepôt est assurée par un moteur d’interrogation fondé sur une ontologie. Notre attention porte plus précisément sur les tableaux extraits de ces documents et convertis au format XML, aux tags exclusivement syntaxiques. Cet article présente la transformation de ces tableaux, sous forme XML, en un formalisme enrichi sémantiquement dont la plupart des tags et des valeurs sont des termes construits à partir de l’ontologie. Mots-clés : extraction de connaissances, entrepôt, ontologie, XML, Web.
منابع مشابه
Enrichissement sémantique de méta-modèles XML et UML pour une transformation bidirectionnelle de modèles
RÉSUMÉ. XML est devenu depuis la fin des années 90 le standard pour échanger et envoyer de l’information sur Internet. Le W3C a ensuite préconisé l’utilisation de XML Schema pour définir la structure des documents XML. A ce jour, la modélisation graphique de modèles XML Schema n’est pas standardisée. L’introduction d’un formalisme de définition de modèles est un moyen de rendre la modélisation ...
متن کاملUne approche pour lextraction automatique de structures sémantiques de documents XML
RÉSUMÉ. La nature des sources d’informations et les possibilités de description des documents disponibles via ces sources sont en constante évolution. Cette évolution, et l’enrichissement des informations qui en découle, est accélérée par l’expansion du Web, et la mise à disposition de documents de type XML. Or la structure logique de ces documents XML, au travers de balises du genre Contenu, S...
متن کاملEnrichissement d'ontologies grâce à l'annotation sémantique de pages web
Résumé. Nous présentons une approche pour enrichir automatiquement une ontologie à partir d’un ensemble de pages web structurées. Cette approche s’appuie sur un noyau d’ontologie initial. Son originalité est d’exploiter conjointement la structure des documents et des annotations sémantiques produites à l’aide du noyau d’ontologie pour identifier de nouveaux concepts et des spécialisations de re...
متن کاملStructuration sémantique des documents XML : Expérimentations et évaluation
RÉSUMÉ. La norme XML permet la représentation d¶XQ document selon un découpage logique qui ne reflète généralement pas la sémantique de son contenu. Il serait donc intéressant de compléter la structure logique des documents XML par une structure VpPDQWLTXH /¶REMHW GH FHW DUWLFOH HVW DORUV G¶pYDOXHU O¶DSSURFKH G¶H[WUDFWLRQ GH VWUXFWXUHV sémantiques pour les documents XML que nous effectuons sur ...
متن کاملF-CheX : Une approche de fouille dans les documents XML
Résumé. Nous présentons dans cet article une approche de fouille dans les documents XML qui prend en compte la structure et le contenu. Notre approche consiste à effectuer un clustering sur les documents XML. Ces derniers sont représentés par des ensembles de chemins conservant la structure arborescente des éléments. Les ensembles de chemins sont mappés dans une matrice sur laquelle une méthode...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2005